iT邦幫忙

2023 iThome 鐵人賽

DAY 8
0
AI & Data

30天輕鬆搞定資料分析系列 第 23

DAY-23 延伸内容(1):自然語言處理、機器學習基礎

  • 分享至 

  • xImage
  •  

在實作之前,來先談談幾個資料學習的延伸內容,首先從自然語言處理(NLP)跟機器學習(ML)基礎開始講起!

自然語言處理(NLP)

人工智慧領域一種機器學習技術,讓電腦能夠解譯、操縱及理解人類語言。NLP的主要挑戰之一是自然語言的多義性和不確定性,且對於高效分析文字和語音資料至關重要。許多企業使用的NLP案例像是客戶參與、敏感資料遮蔽、商業分析......等。

  • 文本處理: 包括分詞(將文本分成單詞)、詞性標註(確定單詞的詞性,如名詞或動詞)、語法分析等。
  • 情感分析: 熱門NLP應用,識別文本中的情感,例如判斷一篇文章是正面的、負面的還是中性的。
  • 實體識別: 識別文本中的命名實體,如人名、地名、組織機構等。
  • 機器翻譯: 包括機器翻譯,將一種語言的文本自動翻譯成另一種語言。

機器學習基礎

機器學習是人工智慧 (AI) 的子集。它專注於教導電腦從資料中學習,以及使用經驗改善,而不是被明確程式化。是涉及使用算法和統計模型來使計算機系統具有學習能力的領域,他和深度學習與神經網路的元件,都屬於 AI 的衍生領域。

  • 監督學習: 監督學習是一種機器學習的模式,其中模型根據輸入數據和對應的輸出進行訓練。它學習將新的輸入映射到已知輸出的規律。
  • 非監督學習: 非監督學習涉及對未標記數據的建模,通常用於集群分析和降維。
  • 深度學習: 深度學習是機器學習的一個分支,使用深度神經網絡進行學習。它在NLP中取得了巨大的成功,特別是在語言模型和機器翻譯方面。
  • 特徵工程: 這是指從原始數據中提取有意義的特徵以供機器學習模型使用的過程。

NLP和機器學習是相互關聯的領域,它們的結合使我們能夠創建能夠理解和處理自然語言的智能系統。


上一篇
DAY-22 認識統計學(2):抽樣方法、常用機率分配
下一篇
DAY-24 延伸內容(2):網路爬蟲、大數據技術
系列文
30天輕鬆搞定資料分析30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言